豆包悄悄上线的这个新功能,也能用眼睛推理全世界了。
豆包悄悄上线的这个新功能,也能用眼睛推理全世界了。上周我写过一篇AI产品自用分享,当时我说,AI知识问答方面,我会选择openai o3和豆包。
上周我写过一篇AI产品自用分享,当时我说,AI知识问答方面,我会选择openai o3和豆包。
今天凌晨,OpenAI 甩出一对王炸,正式发布两款开源模型:gpt-oss-120b 和 gpt-oss-20b。是的,你没看错,那个曾经被戏称为 CloseAI 的男人,带着他的诚意,回来了!
就在前几天,OpenAI 又搞了个大动作。 他们要在德州阿比林,新增 4.5GW 的电力接入,并且已经和 Oracle 签好了合同。
OpenRouter 再度上线了一款新模型,Horizon Beta 。这款模型是之前上线的模型Horizon Alpha 的提升版本。不出意外,这款模型也是来自于 OpenAI。
让 OpenAI 拿到 IMO 金牌的模型,背后居然只有三个核心开发者?这是 OpenAI IMO 团队最近接受媒体采访披露的信息。
拒绝小扎10亿刀报价的哥们儿,被挖出来了—— Andrew Tulloch,OpenAI前CTO Mira创业搭子,参与了OpenAI GPT-4o到o系列的研发,还曾在Meta工作过11年。
昨夜,谷歌宣布向 Google AI Ultra 订阅用户推出 Deep Think 功能,Gemini 2.5 Deep Think 模型在今年的国际数学奥林匹克竞赛 (IMO) 上夺得金牌。
在人工智能领域,对比语言 - 图像预训练(CLIP) 是一种流行的基础模型,由 OpenAI 提出
近年来,OpenAI o1 和 DeepSeek-R1 等模型的成功证明了强化学习能够显著提升语言模型的推理能力。通过基于结果的奖励机制,强化学习使模型能够发展出可泛化的推理策略,在复杂问题上取得了监督微调难以企及的进展。
在三个月前,OpenAI 研究员 Shunyu Yao 发表了一篇关于 AI 的下半场的博客引起了广泛讨论。他在博客中指出,AI 研究正在从 “能不能做” 转向 “学得是否有效”,传统的基准测试已经难以衡量 AI 的实际效用,他指出现有的评估方式中,模型被要求独立完成每个任务,然后取平均得分。这种方式忽略了任务之间的连贯性,无法评估模型长期适应能力和更类人的动态学习能力。